1
การเชื่อมโยงความน่าจะเป็นกับข้อมูลใน R
AI014Lesson 5
00:00

การแปลงข้อมูลที่เก็บมาอย่างดิบจากแหล่งต้นทางให้เป็นโครงสร้างที่มีระเบียบ วัตถุในภาษา R คือกระบวนการทางเทคนิคที่จำเป็นสำหรับการวิเคราะห์เชิงความน่าจะเป็น ก่อนที่จะสร้างแบบจำลองการแจกแจง เราต้องเรียนรู้พื้นฐานด้าน การนำเข้าข้อมูล และรายละเอียดเชิงโครงสร้างระหว่างรายการ (lists), เมทริกซ์ (matrices) และเฟรมข้อมูล (data frames)

1. การนำเข้าข้อมูลอย่างมีโครงสร้าง

การนำเข้าข้อมูลผ่าน scan() มักจะต้องใช้ โครงสร้างรายการปลอม (dummy list structure) เพื่อกำหนดประเภทของตัวแปร (เช่น list(id="", x=0)) ซึ่งช่วยให้ข้อมูลภายนอกจากไฟล์ เช่น input.dat ถูกประมวลผลให้กลายเป็นองค์ประกอบที่จัดการได้ง่าย แทนที่จะเป็นเวกเตอร์แบนราบ

2. การจัดระเบียบตามมิติ

ในขณะที่ เมทริกซ์ ใช้สำหรับเซตของตัวเลขที่มีลักษณะเหมือนกัน (โดยใช้ byrow=TRUE) ส่วน data.frame() ทำหน้าที่เป็นสะพานสำคัญในการสร้างแบบจำลองทางสถิติ ช่วยให้ชนิดข้อมูลที่หลากหลายสามารถอยู่ร่วมกันได้

ไฟล์ดิบรายการ / เมทริกซ์การแจกแจงความน่าจะเป็น

3. การเข้าถึงตัวแปร

การเข้าถึงข้อมูลเพื่อการอนุมาน ต้องใช้การดัชนีผ่าน inp[[1]] หรือคอลัมน์ที่มีชื่อ เช่น inp$id. ฟังก์ชันเช่น attach() ช่วยให้ตัวแปรภายใน วัตถุทั้งหมด (เช่น eruptions) สามารถเข้าถึงได้โดยตรง โดยไม่ต้องดัชนีซ้ำ ๆ

main.py
TERMINALbash — 80x24
> Ready. Click "Run" to execute.
>